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Abstract 



The hardware has a decoupled configuration register and performs pregnane on a component with a single 
or multi-dimensional cell structure. Data flow or control flow graphs are partitioned into time-separated sub- 
graphs and fonned sequentially and implemented on the component An Independent daim is also included 
for a method for performing programs on a component with a single or multi-dimensional cell structure. 
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Die f oigenden Angaben sind den vom AnmeSdm eiiigaraseht^ UnteHagen entnosnmen 

(g) Hardware und Betriebsverfahren 

@ Die Erftndung betrifft eine ein- oder mehrdimensionale 
Zellstruktur. Hierbei ist eine zeitlich getrennte Sequenzie* 
rung vorgesehen. 



00 

to 
in 

(P 

CM 



lU 

o 



BUNDESDRUCKEREI 10.00 002 050/481/1 



IS 



DE 199 26 538 A 1 



Beschreibung 

Aufgabe der ErfinduDg und Anwendungsbereiche 

5 Die vorliegende Erfindung ersireckt sich auf das Gcbiel von programmierbaren und insbesondeie wahrend des Betrie- 
bes umprogrammierbaren arilhnietischen und/oder logischen Bausteinen mil Vielzahl von anthmedscheo und/oder logi- 
schen Hnheiten, deren Verschalmng ebenfalls programmierbar und wahrend des Bethebes umprograminierbar isL Der- 
artige logische Bausteine sind unter dem OberbegriffFPGA von verschiedenen Hrmen verfilgbar. Weiterfain sind meh- 
reiePatente verdffentlicht, die spezietle arithmetische Bausteine mil automatxscherDatensynchionisation und verbesser- 
10 ten ofTenlegen. 

SSmtliche beschriebene Bausteine besitzen eine zwei- oder mehrdimensionale Anordnung von logischen und/od^ 
aritbmetischen Einheiten, die uber Bussysteme miteinander verschaltbar sind. 

Aufgabe der Erfindung ist es, ein Programmiervo^ahren zur Verfiigung zu stellen, das es ermoglicfat die beschriebenen 
Bausteine in gewohnlichen Hochsprachen effizient zu progranunieien und dabei die Vorteile der duich die Vie!zahl von 
IS Einbeilen eotstehende Parallelitat der beschriebenen Bausteine weitgehend automatisch, vollstandig und effizient zu nut* 
zen. 

Stand der Technik 

20 Bausteine der genannten Gaitung werden zumeist unter Verwendung gew^nlicher Datoiflussprachen piDgrammieit 
Dabei tr^en zwei grundlegende Robleme auf: 

1. DielVogrammierung in Datenflussprachen ist furProgrammierer gewohnungsbedtirftig, tief sequentielle Aufga- 
ben lassen sich nur sehr umstandlich beschieiben. 
25 2. GroBe Applikationen und sequentielle Beschreibungen lassen sich mit den bestehenden t)ber5etzung^)rogram- 
men (Synthese-Tools) nur bedingt auf die gewiinschte Zieltechnologie abbilden (synthetisieren). 

Fur gewohnlich werden Applikationen in mehrere Teilapplikationen parti tioniert, die dann einzeln auf die Zieltechno* 
logie synthetisiert werden (Fig. 1). Die einzelnen Binarcodes werden dann auf jeweils einen Baustein geladen. Wesent- 
30 liche Voraussetzung der Erfindung ist das in DE 44 16 881 beschriebene Verfahren, das es eimoglicht, mehrere paititio- 
nierte Teilapplikationen innerhalb eines Bausteines zu nutzen, indem die zeitliche Abhangigkeit analysiert wird und iiber 
Steuersign^e sequentiell die jeweils erforderlicben lbila{^likationen bd einer ubergeoidneten Ladeeinheit angefordert 
und von dieser daraufhin auf den Baustein geladen werden. 
Exisderende Synthese-Tools sind nur bedingt in der Lage Ptogramm-Schleifen auf Bausteine abzubilden (Fig. 2 
35 (Q201)). 

Dabei werden sogenannte FQR-Schleifen (0202) als Primitiv-Sdileife haufig noch dadurch unterstiitzt, daB die 
Schldfe vollkommen auf die Ressouicen des Zielbausteines ausgewalzt werden. 

WHILE-Schleifcn (0203) besitzen im Gegensatz zu FOR-Schleifen keinen konstanten Abbruchswert. V^elmehr wird 
durch cine Bedingxmg evaluieit, wann der Schleifoiabbruch stattfindet. Daher ist gewohnlicherweise (wenn die Bedin- 
40 gung nicht konstant ist) zur Synthesezeit nicht bekannt, wenn die Schleife abbrichL Duich das dynamische \%rfaalten 
konnen Synthese-Tools diese Schleifen nicht fest auf Hardware abgebildet d. h. auf einen Zielbaustein iibertragoi wer- 
den. 

Rekuisionen sind grundsatzlich nicht auf Hardware abbildbat; wann die Rekursionstiefe nicht zur Synthesezeit be- 
kannt und damit konstant ist Bei der Recursion w^en mit jeder neuen Rekuisionsebene neue Ressouicen allddert. Das 
45 wtirde bedeuten, daB mit jeder Rekuisionsebene neue Hardware zur ^%rfugung gestellt werden muB, was aber dynamisch 
nicht mdglich ist 

Selbst einfache Grundstruktuien sind von Synthesetools nur dann abbildbar, wenn der Zielbaustein ausreichend gioB 
ist, d b. ausieichende Ressouicen bietet 

Ean^be zeitliche Abhangigkeiten (0301) werden durch heutige Synthese-Tools nicht in mehrere Teilapplikationen 
50 paititioniert und sind deshalb nur als Ganzes auf einen Zielbaustein ubertragbai: 

Bedingte Ausftihningen (0302) und Schldfen iiber Bedingungen (0303) sind ebenfalls nur abbildbar, wenn ausrei- 
chende Ressouicen auf dem Zielbaustein existieren. 

EifindungsgemaBes Verfahien 

55 

Durch das in DE 44 16 881 beschriebene Vi^ahren ist es moglicfa Bedingungen zurLaufzeit innerhalb der Hardware- 
strukturen der gniannten Bausteine zu erkennen und derart dynamisch darauf zu reagieien, daB die FunkticMi der Hard- 
ware entsprechend d^ eingetretenen Bedingimg moditiziert wild, was im wesentlidien duich das Konfigurieien einer 
neueo Struktur geschiefat 

60 Ein wesentlicher Schritt in dem erfindungsgemaBen \^rf ahren ist die Partitionierung von Grapben in zeitlich unabhSn- 
gigeTeilgraphen. 

Der Begiiff "zeitliche UnabhSngigkeit" wird damit definieit, daB die Daten, die zwischen zwei Ibilapplikationen Ober- 
tragoi werden durch einen Spdcber, gldcb welcher Ausgestaltung (also auch mittds einfacher Register), entkoppelt 
werden. Die ist besonders an den Stellen dnes Gr^hen mdglich, an denen eine klare Schnittstelle mit einer begrenzten 
65 und mQglichst minimalen Menge von Signalen zwischen den beiden Ibilapplikationen bestdit 

Die zeitliche Unabhangigkeit kann in groBen Graphen durch das gezielte Einfugen von klar definierten und mpglichste 
einfachen Schnittstellen zum Speichera von Daten in einen Zwiscbenspeicher herbeigefilhit werden (vgL Sq in Fig. 4). 
Schleifen weisen gnmdsatzlich eine starke zeitliche Unabhangigkeit auf. da sie lange Zdt uber einer bestimmten Menge 
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von (zumeist) in der Schleife lokalen Variablen aii)eiteQ und nur beim Schleifeneintrilt und bdm veriassen der Schleife 
eine Obertragung der Opa^dofi bzw. des Ergebnisses erfoidern. 

Durcb die zeitliche Unabhangigkeit wird erTeicbt, daB nach der vollstandigen Ausfuhrung einer Ibilapplikation die 
□achfolgende Teilapplikation geladen werden kann, ohne daB iigendwelche weiteren Abhangigkeiten oderEinflusse auf- 
treten. Beim Speichem der Daten in den genannten Speicher kann ein Signal (Trigger) generiert werden, das die ubeige- 5 
oidneten Ladeeinheit zum Nachladen der nachslen Ifeilapplikation auffordert. Der Trigger kann bei der Verwendung von 
einfachen Registem als Speicher immer generiert werden, wenn das Register beschrieben winL Bei der X^rweodung von 
Speichem, i. b. vchi solct^n die nach dem HFO-ninzip aibeiten» ist die Generiening des IViggers von mefareren Bedin- 
gungen abhangig. 

Folgende Bedingungen konnen beispielsweise einzehi oder kombiniert ein IVigger eizeugen : to 

- Hrgebnis-Speicher vol! 

- Operanden-Speicber leer 

- keine neuen Opeianden 

- Beliebige Bedingung inn^halb der Ibilapplikation* generiert duich z. B. IS 

- Veigleichcr 

- Zahler. 

Eine Teilapplikation wird im folgenden auch Modul genannt, urn die \%rstandlichkeit aus Sicht der klassischen Pro- 
granuniening zu eifa^en. Aus demsdben Grand werdoi Signale im folgenden auch Vuiablen genannt Dabd unt^- 20 
scheiden sich die Variablen in eineni Punkt wesentlich von berkoininlicben Variablen: Jeder Variable ist ein Statussignal 
(Ready) zugeoxdnet, das anzeigt, ob die Viable einen gultigen Wert besitzL Wenn ein Signal einen gultigen (berechne* 
ten) Weit besitzt, ist das Statussignal Ready; wenn das Signal keinen gultigen Weti besitzt (Bmchnung noch nicht ab- 
geschlossen), ist das Statussignal Not_Ready. Das Prinzip ist ausftihriich in der Patentanmeldung PACT02 beschrieben. 

2S 

Das Prozessonnodell 

Die in den folgenden Hguren gezeigten Grapfaen besitzen als Grapbenknoten imm^ in Modul, wobei davon ausge^ 
gangen wird, daB mehrere Module auf einen i^elbaustein abgebildet werden konnen. Das heiBl, obwc^l alle Module zeit- 
lich voneinander unabhangig sind, wird nur bei nach den Modulen eine Umkonfiguralion durcbgefUhit, bzw. ein Daten- 30 
speicher eingefiigt, die mit einem vertikalen Stricfa und At markiert sind. Diesor Punkt wird Umkonfigurationszeitpunkt 
genannt. 

Das bedeutet zusammenfassend: 

1 . GroBe Module konnen an geeigneten Stellen partitiomert werden und in kleine zeitlich voneinander unabhangige 3S 
Module zerlegt weiden. 

2. Bei kleinm Modulen die sich genoeinsam auf dnen Zielbaustein abgebildet weiden kdnnen, wild auf die zeitli- 
che Unabhangigkeit verzichtet Dadurch werden Konfigurationsschritte eingespart und die Datenverari>eitung be- 
schleunigL 

3. Die Umkonfigurationszeitpunkte werden entspiechend der Ressourcen der Zielbausteine positioniert Dadurch 40 
ist eine beliebige SkaHeiung dor Graj^eolange gegeben. 

In Fig. 4a sind einige grundlegenden Eigenscbaften des erfindungsgemaBen Verfabrens daigestellt: 
Die Module des lypes A sind zu einer Giuppe zusammengefaBt und besitzen am Ende einen bedingten Sprung, entweder 
nach Bl oder B2. An dieser Position (0401) ist ein Umkonfiguraticmspunkt eingefiigt, da es sinnvoU ist die Zweige des 45 
bedingtoi Sprunges als jeweils cine Gruppe zu bcu^hlen (Fall 1). Wiirden dagegen beide Zweige von B (B 1 und B2) zu- 
satzlich zu A auf den Zidbaustein passen (Fall 2)» ware es sinnvoU nur einen Umkonfiguiationspunkt bei 0402 dnzufii* 
gen, da dadurch die Zahl der Konfiguratiooen veningert wird und sich die Verazbeitungsgescbwindigkdt erfa^t Beide 
Zweige (Bl und B2) springen bei 0402 nach C 

Die Konfiguzation der Zellen auf dem Selbaustdn ist in Fig. 4b schematiscfa daigestellt Dabd werden die Funktionen SO 
der einzelnen Grapbenknoten auf die Zellen des Zielbausteins abgebildet Jeweils eine Zeile stellt dne Konfiguration dan 
Die gestricheltcn Pfcile bei dnem Zeilenwecbsel zdgcn eine Umkonfiguration. Sx» ist eine dalenspeichemde ZcUe, von 
beliebiger Ausgestaltung (Register; Speicher, etc.). Dabei ist SJ ein Spdcher, der Daten entgegennimmt und SqO ein 
Speidi^ der Daten ausgibt Der Spdcher ist fiir gleiche n jeweils derselbe, I und O kennzdchnra die Datentransfer- 
richtung. SS 

Beide Falle des bedingtra Sprunges (Fall 1, Fall 2) sind daigestellt 

Das Modell in F^. 4 entspricht einem Datenflufimodell» jedoch mit der wesentlichen Erweiteiung der Umkonfigura- 
tionspunkt und der damit eneichbaren Partitiooienuig des Grapben, wobd die zwischen den P^tionen ubeitragenen 
Daten zwiscbengespeichert werden. 

Im Modell von Fig. 5a wird aus einer beliebigen Grapbenmenge und -Konstellation (0501) selekti v ein Graph aus d- 60 
ner Menge von Graphen B aufgerufen. Nach der Ausfiihrung von B gelangen die Daten nach 0501 zuhick. 

Wild in 0501 ein ausreichend grofier Sequencer (A) implementiert, ist mit dem Modell dn den typischen Ptozessoreo 
sehr Shnliches Rrinzip imploneotieibar. Dabd gelangen 

1 . Daten in den Sequenzer A, (tie dieser als BefeUe dekodiert und entspiechend don "von Naiinann"-I^inzip dar- 65 
auf reagiert; 

2. Daten in den Sequenzer A, die als Daten betrachtet werden und an dn fest konfiguriertes Rechenwerk C zur Be- 
lecbnung wdtergeldtet werden. 
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Ver Graph B slellt selektierbar dn bescmderes Rechenwerke und/oder besondere Opcodes fiir besdmmte Funktionen 
zur VerfuguDg und wird alteraativ zur Beschleunigung von C verwendeL Beispielsweise kann Bl ein optimierter Algo- 
rithmus zu Berechnung von MatrixmuMplikationen sein, wahrend B2 einen FIR-Filt^ und B3 eine Mustererkennung 
5 darstellt. Entsprechend eines Opcodes der von 0501 dekodiert wird, wind der geeignete bzw. entsprechende Graph B auf- 
gexufen. 

Fig. 5b schematisiert die Abbildung auf die einzelnen Zellen, wobei in 0502 der pipelineartige Rechenwerks-Cbarac- 
ter symbolisiert wird. 

Wahrend in den Umkonfigurationspunkten von Fig. 4 vorzugsweise gioBeie Speicher zum Zwiscbenspeichem der Da- 
10 ten eingefugt werden, ist dne einfache Synchronisation der Daten in den Umkonfigurationspunkten von Fig* 5 ausiei* 
chend, da der Datenstrom vofzugswdse als ganzer durch den Graphen B ISuft und der Grai^ B nicht weiter partitioniert 
ist; dadurd) ist das Zwiscbenspeichem der Daten iiberflussig. 

Id Fig. 6a sind verschiedeDe Schleifen daigestellt. Scbldfen kdnnen grundsStzlicb auf diei Arten behandelt werden: 

IS 1 . Hardware- Ansatz: Schleifen werden vollstandig ausgewalzt auf die Zielhaidware abgebildet (0601a/b). "Wle be^ 

reits erlSutert ist dies nur bei woiigen Schldfenarten moglich. 

2. Datenflufi-Ansatz: Innerhalb der Datenflusses werden Schleifen uber mehiere Zellen hinweg aufgebaut 
(0602aA>). Das Ende der Schleife wird auf den Schleifenanfang ruckgekoppelU 

3. Sequenzer-Ansatz: Bn Sequenzer nnt minimalem Befehlssatz fiihrt die Schleife aus (0603a/b}. Dabei sind die 
20 Zellen der Zielbausteine so ausgestaltet, dafi sie den entsf»echenden Sequenzer beinhalten (vgl. Fig. 1 1 a/b). 

Durch dne gedgnete Zeriegung von Schleifen kann deren Ausfuhrung ggf. optimiert werden: 

1 . Unter Verwenduhg von Optimieningsmethoden nach dem Stand der Technik laBt sich haufig der Schleifen- 
25 rumpf, also der wiederiiolt auszuftihiende Teil, dadurch optimieren, daB bestinimte Operalionen aus der Schldfe 

entfemt werden und vor oder hinter die Schleife gestellt werden (0604a/b). Dadurch vnxd die Menge der zu sequen- 
cenden Befehle erheblich reduzicrt. Die entfemten Operalionen werden nur einmal vor bzw. nach Ausfuhrung der 
Schldfe durchlauf&n. 

2. Eine wdtere Optimierungsmoglichkeit ist das Ibilen von Schleifen in mehrere kldnere oder kurzere Schleifen. 
30 Dabei findet die Idlung derart statt, daB mehrere parallele oder mehrere sequentielle (0605a/b) Schleifen entstehen. 

Fig. 7 verdeutlicht die Implementierung dner Rekursion. Dabei werden dieselben Ressourcen (0701) in Form von 
Zellen flir jede Rekursionsebene (1-3) verwendet Die Ergebnisse einer jeden Rekursionsebene (1-3) werden bdm Auf- 
bau (0711) in dnen nacfa dem Stack-Fdnzip aufgebauten Speicher (0702) gesdirieben. Gleicfazdtig mil dem Abbau 
35 (0712) der Ebenen wird der Stack abgebaut. 

Hochsprachenbdspiele 
Ein Modul kann bei^elswdse folgendermaBen deklariert werden: 

40 

a od tt X a exampl&l 

input (varl, var2 : tyit var3 : tya) , 
^5 oatpQt Cresl, re82 : tyj) . 

• • • 

^ xogimtwc <re9namel> (resl). 

registar <regndine2> [res2) • 
55 tasBinatae (real « re52; 1). 

and. 

module kennzeichnel den Beginn eines Modules. 
60 input/ou^ul definiert die Ein-/Ausgangsvariablen mit den IVpen tyg. 
begin . . . end markieren den Rumpf des Modules. 

legists <regnamel/2> Obeigibt ds^ Ergebnis an deo Output, wobd des Eigebnis in dem durch <regnamel/2> spezifizier- 
ten Regist^ zwiscbengeq)eicbert winL oegnamel/2> ist dabd eine globale Refoenz auf ein bestimmtes Registec 
Als wdtere t)b«:gabemodi an den Output steben beispielsweise folgende Spdcherarten zur A%rfiigung: 
65 fife <fifoname>, wobei die Daten an einen nach dam FCPO-Plrinzip arbdtendra Spdcher Ob«gd)cn wcxden. fifoname iBt 
dabd dne globale Referenz auf einen bestimmlen, im FIFO-Modus arbeitenden Spetcbei; lerminaie@ wird dabd um 
deo Parameter bzw. das Signal "fifofuU" crweilert, der/das anzdgt, daB der Spdcher vol! ist 

stack <stackname>, wobd die Daten an einen nach dem Stack-Prinzip arbeitenden Spdcher ubeigeben werden. stack- 
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name isl dabei eine globale Referenz auf einen bestimmten, im Stack^Modus arbeitenden Spdchen 
taininate© unterscheidet die Ptogramraiening entsprechend des erfindungsgemafien Xferfahrens von der herkonunli- 
chen sequentiellen FtogramimeiuDg. Der Befebl definiert das Abbnichkriterium des Modules. Die Ergebnisvariablen 
resl und res2 werden von terminate @ nicht mil ihrem tatsachlichen Wert evaluiert, stall dessen wind nur die Gultigkeii 
der Variablen (also deren Statussignal) gepiuft Sind beide Variablen giildg, terminiert das Modul mil dem Wert ]. Das 
bedeutet, ein Signal mil dem Wert 1 wird an die Obeigeoidnelen Ladeeinbeit weileigeldlet, woraufhin (fie tibengeordne- 
ten Ladeeinbeit das nachfolgende Modul 13dL 

mocin l c exampleZ 

iapat (varlr var2 : tya; var3 : tya) . 
ou^t (resl : ty«) , 

register <regnainel> (varX, var2) . 

• • • 

<£i£onamel> (resl, 256). 

tOTiMtae (fifofull«fifonamel>); 1). 
end* 

register wird in diesem Beispiel Qber input-Daten definiert, Dabei isl <regnamel> deiselbe wie in examplel. Dies be- 
wirkt, daB das Register, das die output-Daten in examplel aufbimmt, die input-Daten fiir example2 zur \^rfuguDg stellt 
fifo definiert einen FIFO-Speicher der Tiefe 256 fur die Ausgangsdaten resl. Das Full-Flag (fifofull) des FIFOSpeichers 
wird in terminate® als Abbnichkiilerium verwendel. 

nodttle main 

iopat; (inl, in2 : tyi; in3 : ty,) . 

cntput (outl : ty«). 

begin 

dafine <regnamel> : register (234) . 
define <regnaine2> : register(26) . 
define <fifonamel> : fifo (4). 

(varl2, var72) = call examplel (inl, in2, in3). 

<outl) = call example? (varl2, var72, var243) • 

• • • 

signal (outl). 

t ermi n ste B (example2) . 
end. 

define definiert eine Schniltstelle fUr Daien (Register, Speicber, etc.). Bd der Definition werden die erfoiderlichen Res- 
souicen, sowie die Bezddinung der Schniltstelle angegeben. Da die Ressourcen eindeutig angegeben werden und nur 
cinmal verwendel werden kOnnen, isl die Definition global, dl h. die Bezeichnung gilt filr das gesamte Plrogramm. 
call rult ein Modul als UnterfTOgramm auf. 

signal definiert ein Signal als Ausgangssignal, ohne daB eine Zwisdienspeidieruag verwendel wird. 
Durch terminate® (example2) wild das Modul main terminiert, sobald das Unterprc^ramm example2 tOTnimcrt 
Durch die globale Deklaration "define . . .** isl es prinzipiell nicht mefar notwendig, die so definierten input/ou^ut Si- 

gnale in die Schnittsiellen-Deklaration der Module aufzundimen. Die entspiecfaeiid modifizierten Bd^el-Module wOr- 

den dann folgeodermaBeo aussehen: 
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S Die Zustandsinformaiionen des Prozessormodells 

Zur Bestimmung der 2^tande inneriialb eines Graphen weiden die Statusiegister der einzelnen 2^en (R\£s) Uber 
ein zusMtzlich zum Datenbus (0801) existierendes Status-Bussystem (0802) alien anderen Rechenwerken zur Valligung 
gestellt (Fig. 8b). Das bedeuiei, daB eine Zellc (PAE X) die Statusinformation einer znderen Zelle (PAE Y) evaluieren 
10 kaoD und demeotsprecbend die Dalen verarbeitet. Um den Unterschied zu bestehenden Paralleiecbneisystemen zu ver- 
deutlichen, ist in Fig. 8a der Stand der Ibcbnik angegeben, Dabei ist ein Multiprozessorsystem gezeigt, dessen Prozes> 
soren uber einen gemeinsanien Datenbus (0803) miteinander veibunden sind. Ein explizites Bussy stem fur den synchro- 
nen Austausch von Daten und Status existiert nicht. 
AbschlieBend soil angemearkt werden, daB je nach Aufgabe sowohl der DatenfluBgraph, als auch der KontrollfluBgraph 
IS entspiechend dem beschiiebenen Verfahien behanddt wodeo kann. 

Erweiterungen in der Hardware g^eniiber TACI02 und PACr04 

Durch PACT02 und PACT04 ist der Stand der Ibchnik in Bezug apf die Konfigurationseigenschaften von Zellen (PA- 
20 £s)definiert und verdffentlicht in DE 196 51 075 (PACTQ2) sowie in DE 196 54 846 (PACT04). 
Dabei soil auf zwei Eigenschaften eingegangen werden: 

1 . Einer PAE ist gemaB PACTO2 ein Satz von Konfigurationsregistero zugeordnet, der eine Konfiguration beinhal- 
let (Fig. 8a). 

25 2. Eine Gnippe von PAEs kann gemaB PACIW auf einen Speicher zum Speicbem oder Lesen von Daten zugreifen 
(Fig. 8b). 

Aufgabe ist es, 

30 a) ein Verfahren zu scbaffen, das das Umkonfiguriopen von. PAEs beschleunigt und zeitlich von der Qbogeoidneten 
Ladeeinheit entkoppelt, und 

b) das Verfahren so auszulegen, daB gleicbzeitig die Moglichkeit gesdiaffen wild Qber mdirere Konfigurationen zu 
Sequenzen. 

35 

Entkopplung der Konfigurationsregister 

Das Konfigurationsregister wird von der ubergeordneten Ladeeinheit (CT) entkoppelt (F%. 9), indem ein Satz von 
mehreren Konfigurationsregistem (0901) verwendet wird. Immer genau dnes der Konfigurationsregister bestimmt se- 
40 lekliv die Funktion dar PAE. Die Auswahl des akliven Registers wird uber einen Multiplexer (0902) durchgefuhrl. In je- 
des der Konfigurationsregister kann die CT beliebig schrdben, sofem dieses nicht die aktuelle Konfiguradon der TAB 
bestimmt. Welches Konfigurationsregister von 0902 selektim wird kaim durch verschiedene Quellen bestimmt werden: 

1 . Ein beliebiges Status-Signal oder dne Gruppe beliebiger Status*Signale, die Uber dn Bussystem (0802) an 0902 
45 gefUhrt werden (F^» 9a). Die Status-Signale werden dabd von beliebigen PAEs generieit oder durch exteine An- 

schlUsse des Baustdns zur VerfDgung gestellt (vgl. Fig. 8). 

2. Das Status-Signal der PAE» die von 0901/0902 konfiguriert wird, dient zur Selektion (Fig. 9b). 

3. Ein von der fib^geordneten CT generiertes Signal dient zur Selekdon (Fig. 9c). 

50 Dabei ist es moglich wahlwdse die eingehenden Signale (0903, 0904, 0905) mittels eines Registers fUr dnen be- 
st] mm ten Zdtraum zu speichem. 

Durch den Einsatz mehrere Register wird die CT zeitlich entko{^It Das bedeutet, die CT kann mehrere Konfigura- 
tionen "vorladen", ohne daB eine direkte zdtliche Abhangigkdt besteht 

Lediglich das selektierte Registo* in 0901 noch nicht geladen ist, wird mit der Konfiguration der PAE so lange gewar- 
55 tet, bis die CT das Register geladen hat. Um festzustellen, ob ein Register eine gultige Information besitzt karm ein "\^- 
lid-Bil" (0906) pro Register cingefiihrt werden, das von der CT gesetzt wird. Ist 0906 bei dnem selektierteo Register 
nicht gesetzt, wild uber ein Signal die CT zum schnellstmoglicben Setzteo des Registers aufgefordeit. 

Das in Fig. 9 beschiiebene Verf ahien ist einf ach zu dnem Sequ«[izer erwdt^ar (Fig. 10). Dazu wird ein Mikrokon- 
troUer (1001) zur Ansteuerung der Selektionssignale des Muldplexers (0902) verwendet Der Sequenzer bestimmt dabei 
60 abbSngig vcm der akhiell sddctierten Konfiguration (1002) und dner zus^tzlichen Stanisinformation (1003/1004) die 
nSchste zu selektierende Kcmfiguration. Dabei kann die Stanisinformation 

(a) der Status der Stanis-Signal der PAE, die von 090170902 konfiguri«t wird sdn (Fig. 10a). 

(b) ein beliebiges uber 0802 zugeftihrtes Statussignal sein (Fig. 10b). 
65 (c) eine KomMnatioo aus (a) und (b) sein. 

Zum einfachen \fer5tandnis kann 0901 als dn Speicher betrachtet werden, wobd Qber 0902 ein Befehl von 1001 adres- 
siert wird. Die Adressierung ist dabei abbangig vom Befehl selbst imd von einem Statusregistec Insoweit entspricht der 
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Aufbau einor 'von Neumann** Maschine, mil dem Unierschied, 

(a) der universellen Einselzbarkeit, also den Sequenzer nichl zu verwenden (vgl. Fig. 9) 

(b) dafi das Siatussignal nicht von dem dem Sequenzer zugeordneten Rechenwerk (R\E) generiert weiden muB, 
sondem von einem beliebigen anderen Rechenwerk stammen kann (vgl. Fig* 10b). 5 

V^chdg ist, daB der Sequenzer dabei Spninge, insbesondere auch bedingte Spriinge, innerbalb von Q901 ausfuhren 
kano. 

Bn weiteres zusatzliches odcr altemadves \ferfahren (Fig. 1 1) zum Aufbau von Sequenzem innerbalb der genannten 
Baustdne ist die Verwendung der intemen Datenspeicher (1101) zum Speichem der Konfiguralionsinformation fur cine lO 
PAR Dabei wird der Datenausgang eines Speichers auf einen Konfigurationseingang einer PAE geschallet (11Q2). Die 
Adresse (1103) fiir 1101 kann dabei von derselben PAE oder einer beliebigen anderen generiert werden. 

Bei diesem Verfahren ist der Sequenzer nicht fest implementiert, sondem wild durch dne PAE od^ eine Gnippe von 
PAEs nacbgebildet 



PatentansprOche 



IS 



1. Verfahren zum AusfOhren von Ftogrammen auf einem Baustein mil ein- odcr mehrdimensionaler Zellstruktur, 
dadiirch gekennzddinet, dass Datenfluss- oder Kontrollflussgraphen in zeitlicb getrennte Ibilgraphen partitioniert 
werden und sequentieU auf den Baustein abgebildet und ausgefOhrt weiden. 20 

2. Hardware mit entkqppeltem Kcmfigurationsregister 
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